Bienvenidos a este e-Tutorial, en el que voy a cubrir porque deberías usar R, como instalarlo, y dar tus primeros pasos. 1

¿Qué es R y porqué usarlo?

R es un lenguaje gratuito, libre, de código abierto, y orientado a objetos. R no es un lenguaje de programación como C o Java. No fue creado para el desarrollo de software, sino que fue diseñado por estadísticos como un entorno interactivo para el análisis de datos. El siguiente video te cuenta en 60 segundos que es R y su historia.

La interactividad es unas de sus características más importantes, ya que nos permitirá explorar rápidamente los datos con los que estamos trabajando. Pero, además, dado que es un lenguaje de programación, al igual que otros lenguajes, uno puede guardar su trabajo en scripts que pueden ser ejecutables en cualquier momento.

Al ser libre y de código abierto implica que cualquiera es libre de usar, redistribuir, y cambiarlo de cualquier forma. Es decir, que podemos no sólo usar las funciones que vienen en el software, sino que también crear propias, o utilizar las que otros investigadores, desarrolladores, y miembros de la comunidad idearon y pusieron a disposición en [CRAN] (http://cran.r-project.org), github, u otros lugares.

Adicionalmente, R esta extremadamente bien soportado, y la comunidad es genial. Si tiene una pregunta puede googlearla, publicarla en StackOverflow o usar R-bloggers . Es más, los usuarios habituales resaltan esto cuando se les pregunta como se puede ver en la gráfica de abajo.

Si aún no está convencido, simplemente escriba “por qué usar R” en google, y creo que los resultados hablarán por sí mismos.

Finalmente, y no menos importante, es gratuito y siempre lo será.

Descargar e Instalar R

Podemos obtener una copia gratuita de R en CRAN (Comprehensive R Archive Network) y eligiendo su sistema operativo. Los pasos para escargarlo e instalarlo son:

  1. Ir a http://cran.r-project.org
  2. Escoger tu sistema operativo.
  3. Hacer click en la última versión disponible para tu sistema.
  4. Una vez descargado, seguir las instrucciones para instalarlo.

El siguiente .gif ilustra los pasos para la instalación en mi sistema operativo que es macOS, en un Mac con procesadores Intel 64-bit.

Versiones de R

Es importante tener en cuenta la versión de R que uno esta instalando y utilizando. Una nueva versión principal de R sale una vez al año y hay 2 o 3 lanzamientos menores cada año. Por ejemplo, la version de este tutorial es R 4.2.2 "Innocent and Trusting" lanzada 2022/10/31.

Es una buena idea actualizar R regularmente. La actualización puede ser un poco complicada, especialmente para las versiones principales, que requieren que reinstale todos sus paquetes, pero posponerlo solo empeora las cosas.

Rstudio

Luego de descargar R, podemos trabajar al menos de dos formas: utilizando una interfaz gráfica o trabajando en batch mode. En este curso utilizaremos la interfaz gráfica, pero te invito que explores el batch mode.

La distribución de R estándar viene con una interfaz gráfica (GUI) lista para ser utilizada. Luego de instalar R, notarás que creo un acceso directo en su escritorio. Haciendo doble click en este podrás utilizarla.

Otra opción, y la que usaremos en el curso, es RStudio, que también es gratuito y de código abierto. RStudio es un entorno de desarrollo integrado, o IDE, para la programación en R. Podes pensar a R como el motor y Rstudio como la carrocería.

Los pasos para descargarlo e instalarlo son:

  1. Ir a https://posit.co/download/rstudio-desktop/
  2. Ir a Install RStudio Desktop
  3. Escoger tu sistema operativo.
  4. Hacer click en la última versión disponible para tu sistema.
  5. Una vez descargado, seguir las instrucciones para instalarlo.

RStudio al igual que R se actualiza un par de veces al año. Cuando haya una nueva versión disponible, RStudiote lo hará saber. Es una buena idea actualizar regularmente para que pueda aprovechar las últimas y mejores funciones. El siguiente .gif ilustra los pasos para mi sistema operativo:

Primeros pasos en R con Rstudio

El siguiente paso es aprender la sintaxis de R, lo que significa aprender sus reglas. Para contar con más herramientas de apoyo en el uso de R trabajaremos en RStudio. Luego de abrir Rstudio, verás cuatro ventanas junto con la barra de opciones en la parte superior.

Brevemente, estas ventanas muestran:

  • Ventana 1: es el editor de scripts: se trata del lugar donde escribimos y editamos los comandos para posteriormente ejecutarlos. Al escribir allí no sucederá nada, a no ser que se apriete algún botón para ejecutar los comandos o la tecla ctrl+enter.

  • Ventana 2: es el “entorno de trabajo” del programa: en este lugar se muestra el conjunto de datos y los ‘objetos’ (resultados, variables, gráficos, etc.) que se almacenan al ejecutar diferentes análisis.

  • Ventana 3: es la consola. Corresponde a lo que sería el software R, al motor, en su versión básica. Allí el software ejecuta las operaciones realizadas directamente desde la consola o desde el editor de scripts.

  • Ventana 4 tiene varias sub pestañas:

    1. la pestaña Files permite ver el historial de archivos trabajados con el programa;
    2. la pestaña Plots permite visualizar los gráficos que se generen;
    3. la pestaña Packages permite ver los paquetes descargados y guardados en el disco duro así como gestionar su instalación o actualización;
    4. la pestaña Help permite acceder a los manuales de ayuda de los paquetes y las distintas funciones.
    5. la pestaña Viewer muestra los resultados al construir reportes mediante funcionalidades tipo rmarkdown.
    6. la pestaña Presentation muestra los resultados de construir presentaciones HTML5 mediante una combinación de Markdown y R.

Sintaxis y Ejemplos

El siguiente paso es aprender la sintaxis de R, lo que significa aprender sus reglas. Para dar nuestros primeros pasos trabajaremos en la ventana 3 donde se muestra la consola. Esta ventana nos mostrará los resultados de los análisis, o cualquier mensaje asociado con el código ingresado en la línea de comando (después de la flecha >).

Por ejemplo, podemos comenzar usando R como calculadora, probemos en la consola:

    2 + 2
[1] 4

o

    log(1)
[1] 0

El [1] indica que es el primer resultado del comando, y en este caso, el único. Pero puede también ingresar algo son múltiples valores, por ejemplo, una secuencia de enteros desde el 10 al 40:

    10:40
 [1] 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
[26] 35 36 37 38 39 40

La primer línea inicia con el primer valor retornado, designado con [1], la segunda línea comienza con el 26vo, designado con [26].

Para salir de su sesión puede escribir simplemente o cerrar RStudio:

    q()

Paquetes en R

Cuando instalamos R este viene con funciones básicas, que si bien son poderosas, sólo reflejan una pequeña fracción de lo que es posible hacer. Es más, nos referimos a estas funciones como base R. Las funcionalidades adicionales vienen dadas por paquetes.

Un paquete junta código, datos, documentación y pruebas, de forma tal que es fácil de compartir con otros. En R, uno puede compartir código a través de estos paquetes.

Al momento de escribir este tutorial, enero de 2023, hay más de 18,975 paquetes disponibles CRAN. Esta enorme variedad de paquetes es una de las razones por las que R tiene tanto éxito: lo más probable es que alguien ya haya resuelto un problema en el que estamos trabajando y por lo tanto podemos beneficiarnos de su trabajo descargando su paquete. Por ejemplo, yo he creado dos paquetes: RATest e ioanalysis

En este curso utilizaremos varios paquetes, uno de los principales será tidyverse, que en realidad es una colección de paquetes R diseñados para la ciencia de datos. Todos los paquetes comparten una filosofía de diseño, gramática y estructuras de datos subyacentes.

Instalar un paquete

Para instalar un paquete utilizamos la función install.packages()

install.packages("tidyverse")

En RStudio, también puede hacerlo en la pestaña de Tools.

Cargar un paquete

Una vez instalado hay que llamarlo o cargarlo con la función library:

library(tidyverse)

Una vez instalados no es necesario volverlos a instalar, pero si cargarlos cuando vamos a utilizarlos. Recordemos, también que los paquetes están instalados en R (el motor), y no en RStudio (la carroceria).

Finalmente, podemos ver todos los paquetes que tenemos instalados con la función:

installed.packages()

El paquete pacman

A menudo utilizaremos un paquete pacman. Este paquete es una herramienta para administrar otros paquetes de R, especialmente reduciendo la tarea de instalar y llamar los paquetes a utilizar.

Para ilustrar su funcionamiento, supongamos que queremos utilizar los paquetes RATest y tidyverse, pero no sabemos si estan instalados en el sistema. Pacman a través de la función p_load, se asegurara de verificar esto por nosotros, si el paquete existe en el sistema lo llamará, y si no lo instalará desde CRAN o desde los repositorios en su lista.

El flujo de trabajo sería entonces:

library(pacman)

p_load(RATest, tidyverse)

Podemos ver entonces que los paquetes estan instalados y cargados.

Cierre y recursos adicionales

En este tutorial hicimos un breve recorrido de porqué utilizar R, como instalarlo e instalar Rstudio. También dimos nuestros primeros pasos en el software.

Existen muchos recursos para aprender y profundizar R, a continuación una lista no exhaustiva:


  1. Aplican los “disclaimers” usuales. Si tenes comentarios, sugerencias, no dudes en enviarme un mensaje por Slack, serán muy bienvenidos y tenidos en cuenta para la calificación final.↩︎